# encoding: utf-8
"""
@author: 夏洛
@QQ: 1972386194
@file: 01-正则.py
"""

import re
content = 'Hello 123 456 welcome to tuling'
print(len(content))
result = re.match('^Hello\s\d\d\d\s\d{3}\s\w{7}', content)
print(result)
print(result.span())
print(result.group())

content = 'Hello 123456 welcome to tuling'
result1 = re.match('^Hello\s(\d+)\swelcome', content)
print(result1.group(1))

# 全匹配
result2 = re.match('^Hello.*ng$', content)
print(result2)
# 匹配某某开始到某某结束    开始 结束 为参考点 只提取()里面得数据
result3 = re.match('^Hello(.*)ng$', content).group(1)
print(result3)
content1 = 'http://xxxxx.com/yyds/asasasda'
result4 = re.match('http.*com/(.*?)s', content1)  # 非贪婪  匹配到第一个s就结束
print(result4.group())
result5 = re.match('http.*?com/(.*)s', content1)  # 贪婪  尽可能匹配更多得数据 到最后一个S位置结束
print(result5.group())

# 这个修饰符的作用是匹配包括换行符在内的所有字符。
content2 = '''Hello 1234567 World_This
is a Regex Demo
'''
result6 = re.match('^He.*?(\d+).*?Demo$', content2,re.S)
print(result6)



html = '''<div id="songs-list">
<h2 class="title">经典老歌</h2>
<p class="introduction">
经典老歌列表
</p>
<ul id="list" class="list-group">
<li data-view="2">一路上有你</li>
<li data-view="7">
<a href="/2.mp3" singer="任贤齐">沧海一声笑</a>
</li>
<li data-view="4" class="active">
<a href="/3.mp3" singer="齐秦">往事随风</a>
</li>
<li data-view="6"><a href="/4.mp3" singer="beyond">光辉岁月</a></li>
<li data-view="5"><a href="/5.mp3" singer="陈慧琳">记事本</a></li>
<li data-view="5">
<a href="/6.mp3" singer="邓丽君">但愿人长久</a>
</li>
</ul>
</div>'''

results = re.findall('<li.*?href="(.*?)".*?singer="(.*?)">(.*?)</a>', html, re.S)
print(results)
print(type(results))
for result in results:
    print(result)
    print(result[0], result[1], result[2])

str1 = 'asdbsd12312312eqw'   # /d 匹配数字  + 1次到多次 匹配
print(re.search('bsd(\d+)eq', str1).group())

# 快速开发登录页面   5分钟开发好


# [\u4e00-\u9fa5]  固定写法  匹配中文
s = '大家晚上好asdasdsad'
aa = re.findall('[\u4e00-\u9fa5]+',s)
print(aa)




